摘要ChatGPT的爆火,使得OpenAI与微软赢得了语言大模型领域的阶段性胜利,而在资源、技术、市场等方面与之旗鼓相当的DeepMind与谷歌组合却在此轮竞争一直处于被动追赶。为理解OpenAI取得阶段性胜利的关键,本文分析四家公司在语言大模型领域的系列布局,总结出OpenAI胜出的三层因素:技术与市场的机遇、微软提供的丰厚资源支持、OpenAI自身技术与商业兼重的决策理念,并对国内科技企业发展AI大模型提出如下建议:一是抓住当下的热点时机,及时跟进,谨慎布局。二是重视研发资源的持续保障问题,更多以投资与合作方式推进AI大模型研发布局。三是着力打造“科技+商业”兼重的科技领导力。OpenAI的成功:时机、资源、理念的综合结果
ChatGPT的爆火,使得OpenAI与微软取得了语言大模型(LLM)领域的阶段性胜利,也开启了AI大模型竞争的序幕。通过综合分析OpenAI、DeepMind、微软、谷歌四家企业在语言大模型(LLM)领域的系列布局1(如图1所示),可以看出本轮OpenAI的成功,是时机、资源、理念的综合结果。
技术与市场的机遇涌现,OpenAI恰逢人工智能产业进入新一轮创新发展的时间节点。技术层面,深度学习技术历经多年积累,新的创新成果正在加速诞生。2015年,“Attention”机制问世,可从海量信息中以较低的算力快速筛选高价值内容,为之后语言大模型的深度学习架构埋下种子;2017年,RLHF技术诞生、基于“Attention”机制的语言大模型架构“Transformer”诞生并在随后两年演进出Decoder-Only、Encoder-Only、Encoder-Decoder等三大技术路线;2018年,预训练技术成功激活深度神经网络对大规模无标注数据的自监督学习能力,加快了大模型参数规模与性能的提升速度。深度学习领域的基础技术已相对完备,目前几乎所有最先进的语言大模型,都源自少数几个基础模型(例如GPT、BERT等),通过精巧的技术组合与充分的训练,即可相对较快地推动大模型的能力提升,研发成果开始加速涌现。市场层面,因经济下滑与劳动力问题,资本市场急需新的热点。2022年大多数欧美发达国家出现较严重的通胀,劳动力成本攀升,而AI的性能提升与算力服务的价格下降,让资本市场再次看到通过AI替人来减少企业经营成本的可能性,推动生成式AI的投资交易进入高潮。同时,科技领域的投资也迫切需要一个新的亮点,ChatGPT的潜力激发了投资者对技术发展大事件的渴望,资本市场的助力进一步强化了ChatGPT的火爆程度。
微软给予OpenAI充足的资源支持,保障了研发的可持续性。OpenAI及时建立与微软的合作,获得研发资源、产品应用渠道、行业影响力塑造等多重支持。首先,微软对OpenAI的投资累计已达到130亿元。其中大部分以Azure云资源兑现,为OpenAI减轻了上亿美元级的云计算费用2。根据媒体数据,OpenAI未与微软合作前,其模型训练在谷歌云上进行,2019至2020年期间共计花费1.2亿美元的云计算费用;迁移至Azure后,2020年同期在云计算上的支出已经下降到5.2万美元。其次,微软旗下产品与OpenAI技术加速捆绑,推进商业化进程。2023年2月,微软表示ChatGPT将与微软全线产品整合,目前已推出集成ChatGPT的新版必应搜索3,在Edge浏览器推出“聊天”和“作曲”两个新的人工智能增强功能;3月,微软发布由GPT-4驱动的Copilot的人工智能服务,将其嵌入Office办公软件中。微软的高额投资以及对技术应用的大力支持,让OpenAI的技术获得全球关注,为其晋级全球顶级人工智能实验室提供坚实助力。
OpenAI的核心领导层具备多元化背景,形成了技术与商业兼重的决策理念。OpenAI的三位核心人物4兼具投资、创业、技术背景,使得OpenAI更注重打造技术与商业的循环,在技术研发与企业经营理念上与DeepMind具有显著区别。一是重视商业经营,及时转型盈利性组织。OpenAI在成立四年后(2019年)就开启盈利化转型,发起设立OpenAI LP(具有100倍“利润上限”的公司),在获得微软支持后,研究方向也由广泛的AGI领域聚焦到更具商业化潜力的语言大模型(LLM)领域。二是重视投资布局,开展多项投资整合生成式AI的系统布局。自2021年起,OpenAI创业基金投资了至少16家公司,后续成立加速器Converge,投资10家公司;投资领域覆盖音视频编辑应用开发、AI笔记应用开发、芯片等众多领域,这些投资项目与OpenAI的产品互相借力,共同强化OpenAI在生成式AI领域的布局。三是秉持“实用至上、交互迭代”的技术创新理念。首先,OpenAI的技术创新更倾向于以工程创新实践AI大模型研发,对外部技术成果保持开放包容、择优吸纳的态度。GPT系列模型陆续借鉴了谷歌Transformer、Instruction Tuning、RLHF和“思维链”的技术基础。其次,OpenAI更关注用户交互,致力于在用户交互中实现AGI,此次ChatGPT性能提高的一大关键是通过用户标注中反馈学习(RLHF)促成了模型“涌现能力”。反观DeepMind,其发展理念更偏向于学术驱动的项目制研究。该公司至今仍保留非盈利的目标,研究方向更偏向于通用模型、生命科学、数据等基础科学领域研究。国内科技企业正在纷纷跟进AI大模型研发布局,竞争日趋激烈。参考OpenAI的发展经验,为科技企业提出三点策略建议:一是抓住当下的热点时机,及时跟进,谨慎布局。AI大模型发展已受到政府、产业、资本各界的密切关注,此时入局更易获得市场关注度和资源支持。在布局过程中,由于AI大模型的风险已引起监管部门重视,相应治理政策陆续出台(例如,国家互联网信息办公室已发布《生成式人工智能服务管理办法(征求意见稿)》),AI大模型的监管要求日益增多,建议科技企业密切关注国家与产业的合规要求,谨慎选择技术路线及应用服务开发方向。二是重视研发资源的持续保障问题,更多以投资与合作方式(而非全部自研)推进AI大模型研发布局。AI大模型研发投入大、周期长、风险高,诸如谷歌、微软等科技巨头也均采取投资方式布局。建议科技企业全面衡量自身研发资源储备,更多以投资与合作方式推进AI大模型研发,积极关注高校、科研机构、初创企业的相关科技项目,同步探索以算力和数据资源为支付形式的投资模式,以缓解面向前沿科技领域布局的资源压力。三是着力打造“科技+商业”兼重的科技领导力。对于科技企业发展而言,技术领先是核心优势,商业变现则是企业发展保障,技术与商业双向联动,才能支撑科技企业的长期发展。建议科技企业着力加强以市场需求引导技术研发,组建科技与商业兼重的领导与决策体系,以高层领导力打通科技创新与商业发展的联动循环,做好科研攻关和成果转化的平衡,避免陷入技术领先而商业落后的局面。注释:
2. 与此相应的,OpenAI被要求将微软作为独家云服务商
3. 新必应搜索采用 AI 模型 GPT 3.5 的升级版,比 ChatGPT 使用的 GPT 3.5 更强大,能够使用最新信息和注释答案更好地回答搜索查询,可以切进或切出聊天模式。它的搜索查询框最多可以接收 1000 个字符。微软介绍,必应会在 Web 上搜索相关内容,然后汇总找到的内容以生成有用的响应。它还引用它的源,以便你可以查看指向其引用的 Web 内容的链接
4. CEO Sam Altman,是创业投资加速器Y Combinator的合伙人背景出身,投资履历优异;
总裁Greg Brockman,早年担任Stripe公司的CTO,帮助公司从4人扩大到250人的规模,组织经营经验优异;首席科学家IIya Sutskever,拥有斯坦福大学学历背景,谷歌大脑研发经历,技术能力优异
关于我们:中移智库以中国移动研究院为主体建设,广泛汇聚数字经济研究力量,着力提升政策性课题研究的专业性和权威性,并扩大研究成果的影响力、公信力、传播力,为数字经济的高质量发展贡献智慧力量。